草庐IT

php - UTF-8 与 PHP DOMDocument loadHTML?

全部标签

xml - XML 中的 UTF-8 或 ISO-8859-1

我们有一个应用程序,它将用户输入的文本字符串输入到Web表单中,并将其打包为XML。只是为了稍微混淆一下,XML作为Outlook电子邮件消息的正文发送。因为用户几乎可以将任何内容粘贴到Web表单中(通常来自Word),文本字符串可以包含非ASCII(7位)字符,例如用于左双引号和右双引号的字符。该字符串通过电子邮件原封不动地传输,但是当我们使用MicrosoftXML解析器时,它会(非常正确地)提示XML包含无效字符。快速修复是将encoding="iso-8859-1"放在header中。但是,我想知道一开始就以真正的UTF-8格式对XML文件进行编码是否会更好,因为我读过的文章指

C# XmlWriter 和无效的 UTF8 字符

我们创建了一个单元测试,它使用以下方法生成随机UTF8文本:privatestaticRandom_rand=newRandom(Environment.TickCount);publicstaticbyteCreateByte(){return(byte)_rand.Next(byte.MinValue,byte.MaxValue+1);}publicstaticbyte[]CreateByteArray(intlength){returnRepeat(CreateByte,length).ToArray();}publicstaticstringCreateUtf8String(i

ruby - Nokogiri 无法使用 UTF-16 声明输出 XML(理解和解决)

总结尝试读取和序列化具有UTF-16编码和声明的XML文档会导致Nokogiri在某个点后产生垃圾。这是一个错误,还是对此有合理的解释?避免它的最佳方法是什么?环境C:\>nokogiri-v#Nokogiri(1.5.5)---warnings:[]nokogiri:1.5.5ruby:version:1.9.3platform:i386-mingw32description:ruby1.9.3p194(2012-04-20)[i386-mingw32]engine:rubylibxml:binding:extensioncompiled:2.7.7loaded:2.7.7详情我有一

xml - readHTMLTable 和 UTF-8 编码

我一般在readHTMLTable和XML包中遇到编码问题。我想从波兰网站allegro.pl(类似于ebay的拍卖网站)下载一些表格,但之后,波兰字体存在编码问题,即使我在中使用encoding="UTF-8"或stringsAsFactors=F读取HTMLTable。代码:library(XML)url结果:>head(alldata[,c(2,3)])V2V31FacebookFanPagezANIMACJĄindywidualnyprojektKupTeraz!150,00zł2Lubięto!Facebook!OKAZJA!!!160FANĂ“W!!!Z

c# - 使用 XDocument 获取大写的 UTF-8

我需要在我用XDocument制作的XML文档的顶部有XML编码和版本。我有这个,但它是小写的,它需要是大写的。我需要做什么?我使用名为“doc”的XDocument类声明了一个新的XML文档。我使用doc.Save();将其保存到一个文件中。我试过:doc.Declaration.Encoding.ToUpper();声明一个新的XDeclaration以大写形式键入编码并将我的doc.Declaration设置为我的XDeclaration。它仍然以小写形式出现。 最佳答案 您可以创建自定义XmlTextWriter,例如:pu

XML 规范和 UTF-16

Section4.3.3和AppendixF的XML1.0spec谈谈UTF-16,byteordermark(BOM)在UTF-16编码的数据流中,以及XML编码声明。从这些部分的信息来看,UTF-16文档似乎需要字节顺序标记。但是附录F中的总结图给出了一个UTF-16输入没有Byteordermark的场景,但是这个场景有xml声明。根据4.3.3节,UTF-16编码的文档不需要编码声明(在这种情况下,XML声明本身是可选的)。根据此信息,如果文档的其余部分是格式正确的,那么一个既没有BOM也没有XML声明且缺少外部提供的编码信息的UTF-16xml文档是否被认为格式正确?

xml - XML声明中的默认编码(UTF-8)如何默认?

我知道thedefaultencodingofXMLisUTF-8。所有XML使用者必须(MUST)等等。因此,这不仅仅是XML是否具有默认编码的问题。我也知道文档开头的theXML-Declarataion是可选的。并且在其中指定编码的内容也是可选的。因此,我问自己以下两个XML声明是否是完全相同的两个表达式:根据我目前的理解,我会说这些是等效的,但我不知道。是否在某处指定了这两个声明的等效项?(考虑这两行示例,每行都是XML文档的第一行,后跟任意(零个)字节,并经过UTF-8编码) 最佳答案 简短答案在没有外部编码信息的UTF-

Ajax 查询适用于数据类型 :'text' 失败,数据类型为 :'text/xml; charset=utf-8'

当我尝试使用'text/xml;的数据类型进行Ajax查询时;charset=utf-8'...我得到一个解析错误。xml响应是有效的xml响应header显示“文本/xml”的内容类型;字符集=utf-8'。不是跨域请求这三个问题是其他parsererror问题的答案。我的ajax看起来像这样:$('#submitLogin2').click(function(e){e.preventDefault();varformData=$('#loginForm2').serialize();varurl='http://somewhere.com/Api2.0/Session_Create

xml - PHP DOMNode insertAfter?

我对如何重新排序节点有点困惑。我正在尝试添加两个简单的“向上移动项目”和“向下移动项目”功能。虽然insertBefore()做了我想在前一个节点之前移动同级节点的操作,但在DOM中向下移动一个节点的最简单方法是什么?非常感谢! 最佳答案 代码示例:try{$li->parentNode->insertBefore($ul,$li->nextSibling);}catch(\Exception$e){$li->parentNode->appendChild($ul);} 关于xml-PH

c# - XslCompiledTransform 使用 UTF-16 编码

我有以下代码,我想使用UTF-8编码格式输出xml数据。但它始终以UTF-16格式输出数据:XslCompiledTransformxslt=newXslCompiledTransform();xslt.Load(XmlReader.Create(newStringReader(xsltString),newXmlReaderSettings()));StringBuildersb=newStringBuilder();XmlWriterSettingswriterSettings=newXmlWriterSettings();writerSettings.Encoding=Encod